时政
财经
科技
虚拟货币
其他
登录
#Yann LeCun
关注
宝玉
1个月前
如果你正处在人生的低谷,觉得自己怎么努力都不够,也许 Soumith Chintala 的故事能给你一点力量。 这位后来创造了 PyTorch、成为 Meta 副总裁 的男人,起点并不光鲜。 Soumith 来自印度的 Hyderabad Public School。学业成绩算不上差,但“数学不好”这件事一直像阴影一样跟着他。 高考时,他没进一线名校,而是进入了印度人眼中的“二本院校”—— VIT(Vellore Institute of Technology)。 大学毕业时,他考了 GRE 1420(老版本满分 1600),成绩不错,但申请 12 所美国硕士项目时,居然全军覆没。 所有学校——无一例外——拒了他。 他想了想,只能用一个词形容自己当时的状态:“fuckit.jpg” 于是他干脆咬牙办了 J-1 交流访问学者签证,直接飞去美国 卡内基梅隆大学(CMU),完全没计划,只想着“先去再说”。 到了美国,他再次申请了 15 所硕士。 这一次结果好一点: 只有 USC 接收了他,以及 NYU(纽约大学)2010 年的补录通知。 来到纽约大学后,他遇到了一个改变命运的人: Yann LeCun —— 当时还没拿图灵奖,也没成为 AI 超级明星。 在 NYU,他还遇到另一位重要导师 Pierre Sermanet,Soumith 说他是“我见过最善良的人之一”。 也是在这里,他开始接触并热爱上了 开源。 毕业后,他投出的简历几乎全部石沉大海。 包括 DeepMind 在内的所有公司都拒了他。 唯一愿意给他机会的,是亚马逊的一份 测试工程师 工作——不是研究岗位,也不是他梦想的 AI 角色。 在低谷时,是他的导师帮了他一把——介绍他去了一家小创业公司 MuseAmi。 但这并没有立刻让他翻身。 之后他还被 DeepMind 再拒两次,加起来三次。 因为 J-1 的“回国两年”要求,他一度无法拿到 H-1B 工作签证。 他花了几个月,与 USCIS 和美国国务院 来回沟通,才终于拿到豁免,得以继续留下。 那段时间,他的自信心跌到谷底。 2011/12 年间,他做出了一个当时非常了不起的成果: 在手机上跑的、全球最快之一的 AI 推理引擎。可即便如此,他还是继续被 DeepMind 拒绝。 最终,真正改变他命运的,是他持续在做的开源项目 Torch7。 他鼓起勇气又给 Yann LeCun 发了封邮件。 就是这封邮件,让他加入了 Facebook 的 FAIR 实验室。 刚进公司时,他差点在训练营“挂掉”,因为一个 HBase 任务卡了很久。 但很快,他抓住了一个关键机会: 当 L8/L9 的资深工程师们都搞不定 ImageNet 的训练问题时,他作为一个 L4 工程师,解决了 数值 / 超参 的关键 bug。 这是他的第一个“大胜利”。 在 FAIR,他负责一个只有三个人的小团队,就是他们后来一起创造了 PyTorch。 但故事并不顺利。 因为内部政治原因,管理层一度打算 关闭 PyTorch 项目。 Soumith 气到一个人坐在酒吧里哭(原话是:cries-at-bar.jpg)。 幸运的是,一些人坚持支持这个项目。 2017 年,PyTorch 正式发布,后来成为全球最受欢迎的深度学习框架之一。 差不多同一时期,他也拿到了 EB-1 杰出人才绿卡。 之后的故事,就成了我们所熟知的历史。 从 2005 到 2017,他经历了: 数学不好 二本院校 两次硕士申请全被拒 所有公司拒绝他 被 DeepMind 拒 3 次、Google 也拒过他 签证危机 项目差点被腰斩 在 Facebook 初期差点挂掉 十二年几乎一直在失败。 但他没有放弃。 最终,他成为 PyTorch 之父、Meta 副总裁、全球 AI 领域最具影响力的人之一。 Soumith 后来也回复了这条推文,特地补了一段话: “这些都是真的。但我还欠很多人一个感谢。” 在 NYU 帮他的导师,是当时的博士生 Pierre Sermanet, Soumith 说他是自己见过最善良的人之一。 Yann LeCun 两次在他“几乎看不到 AI 出路”的时候给他机会, 一次是在 NYU,另一次是在 FAIR。 是 Praveen Garimella 劝他去 IIIT 做最后一年本科项目, 又在他硕士全军覆没后,鼓励他“先去 CMU 再说,不要放弃”。 还有他的父母:Vithal Chintala 和 Rajani Chintala。 他形容自己在一个中产又背着很多债的家庭里长大, 父母后来在 2010 年之后才慢慢实现财务自由。 但在那之前,他们已经在超出自己能力范围的情况下 硬是咬牙支持儿子去追一个“不安全”的梦想路径, 而不是让他去做一份稳妥的工作。 Soumith 说,这是非常伟大的养育方式。 他还特地对原推作者 Deedy 表示感谢—— 正是对方花时间把这些散落在他人生里的“细节”, 一段段挖出来、串成了一个完整的故事。 Soumith 在最后写了一句很平静的话: 我相信,每一个如今“坐在成功之上”的人, 背后都有很多挣扎。 生活从来不会轻轻松松。
#Soumith Chintala
#PyTorch之父
#Meta副总裁
#逆袭
#AI
#Yann LeCun
#人生低谷
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
两年前的Yann LeCun。 看得多了,太多AI大神轻视了语言的符号力量,在ICL的交互空间与人的具身经验耦合后的智能涌现。 虽然LeCun和李飞飞一样都认为LLM到不了AGI,但我想说的是空间智能的路数也一样不行。
#Yann LeCun
#AI大神
#语言的符号力量
#LLM
#AGI
分享
评论 0
0
宝玉
1个月前
FT:Meta 首席 AI 科学家 Yann LeCun 将离职创业 据《金融时报》(FT)报道,Meta 首席 AI 科学家、图灵奖得主 Yann LeCun 计划在未来几个月内离开公司,并创办自己的 AI 初创企业。目前他已在为新项目筹集资金。 LeCun 自 2013 年起一直负责 Meta 的基础 AI 研究实验室 FAIR,专注于长期的基础研究。但近期 Meta CEO 马克·扎克伯格调整了公司战略,转而更快地推出具体的 AI 产品,以追赶 OpenAI 和谷歌。LeCun 原本向 Meta 首席产品官 Chris Cox 汇报,但随着扎克伯格聘请 Scale AI 创始人 Alexandr Wang 负责“超级智能”团队后,LeCun 改为向 Wang 汇报。 FT 报道中称,Meta 近期推出的 Llama 4 模型表现不及竞争对手,AI 聊天机器人也未获市场认可。LeCun 一直质疑扎克伯格高度依赖大语言模型(LLM)的策略,认为这种技术无法真正达到人类的推理和规划能力。他更倾向于研发名为“世界模型”(world models)的新型 AI 架构,这种模型旨在从视频和空间数据中理解现实世界。 今年 Meta AI 部门高管频繁变动。5 月,AI 研究副总裁 Joelle Pineau 离职加入初创公司 Cohere;10 月,Meta AI 研究部门裁员约 600 人。同时,扎克伯格不断以高薪挖角竞争对手人才,包括 ChatGPT 联合创造者赵盛佳(Shengjia Zhao)担任超级智能实验室首席科学家,引起部分 Meta 老员工的不满。 完整新闻:
#Meta
#Yann LeCun
#AI
#离职创业
#战略分歧
分享
评论 0
0
勃勃OC
1个月前
据英国金融时报报道,Meta首席人工智能科学家杨立昆(Yann Lecun)正计划离开这家社交媒体巨头,创办自己的公司。 扎克伯格正寻求彻底改革该公司的AI运营。
#Meta
#Yann LeCun
#离职
#创业
#AI
分享
评论 0
0
Bruce🐼
3个月前
Meta 超级AI实验室传出的八卦 图灵奖得主Yann LeCun现在得向28岁的 Wang 汇报,据说有次会议,LeCun 反对激进计划,但 Wang 回击:「我们是开发超级智能,不是辩论哲学」。 气氛尴尬,传闻 LeCun 可能走人。 从 OpenAI 天价挖来的 Shengjia Zhao(赵胜佳)是ChatGPT 关键开发者,Zhao 因 GPU 资源和奖金争议,威胁回 OpenAI。 现在是拿高薪的不爽,拿低薪的更不爽,或许正如山姆·奥特曼所说:“在我看来,Meta 正在做的事情将导致非常严重的文化问题......有使命的人终将击败雇佣兵。"
#Meta
#Yann LeCun
#AI实验室
#内讧
#文化冲突
分享
评论 0
0
勃勃OC
3个月前
在一份备忘录中,Alexandr Wang 写道:“超级智能即将到来。” 为了“认真对待这一点”,公司正在进行重大调整。MSL 的研究将由赵升佳(Shengjia Zhao)领导。Yann LeCun 将向 Wang 汇报。
#Alexandr Wang
#超级智能
#赵升佳
#Yann LeCun
#公司调整
分享
评论 0
0
Shen Huang
3个月前
为什么 AI 帮你写 1 小时代码还行,写 10 小时就变成一坨屎?为什么 Chatbots 聊上很多轮之后,就开始一本正经地胡说八道? 核心原因就藏在Yann LeCun 23年演讲的这张图里:错误会指数级累积。 想象一下,AI 生成每个 token(词)时,都有一个很小的概率偏离“正确”答案。 假如每一步走对的概率是 99%,那连续走 100 步都对的概率就只剩 36.6% 了。 如果任务更长,比如 1000 步,那正确的概率就无限接近于 0!( 0.002%) 这就是为什么长任务、长对话,最后总会“散架”。因为这条路太长,走错一步,就再也回不来了。LeCun 认为这是 AR 架构的“原罪”,靠打补丁没用。
#AI
#Yann LeCun
#错误累积
#长任务
#AR架构
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞